2 research outputs found

    Um algoritmo de alocação para bancos de dados biológicos distribuídos

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014O presente trabalho propõe um algoritmo de alocação de dados distribuídos baseado na anidade de dados e perfis de uso com foco em bancos de dados (BD) relacionais biológicos. A proposta visa instruir os administradores de banco de dados (DBAs) sobre como alocar os dados nos nós de um cluster visando obter o melhor desempenho possível nas consultas e demais requisições dos usuários. O esquema e verificado através de testes em laboratório. Os experimentos são realizados sobre o sistema data warehouse (DW) Intermine (SMITH et al., 2012) utilizando o pgGrid, que adiciona funções de reaplicação e fragmentação no PostgreSQL e o HadoopDB (implementação do modelo Map-Reduce para bancos de dados relacionais). O algoritmo e comparado com outras propostas de alocação geradas por algoritmos desenvolvidos em pesquisas recentes.Abstract: This work proposes a data allocation algorithm based on distributed data affinity and query profile with focus on biological relational databases.The proposal aims to help database administrators (DBAs) about how to allocate the data across nodes in a cluster in order to obtain the maximum performance improvements on query time and executing other user requests. The allocation schema is verified in laboratory tests. The Intermine datawarehouse (DW) system (SMITH et al., 2012) was chosen as subject of this evaluation. The experiments were executed on distributed database platforms such as pgGrid, which adds replication and fragmentation functions to PostgreSQL and HadoopDB(implementation of Map-Reduce model for relational databases). Finally, the algorithm is compared with other allocation methods developed in recent researches

    pgGrid: Uma implementação de fragmentação de dados para o pgcluster

    No full text
    TCC (graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Curso de Ciências da Computação.A medida que as organizacões crescem, também cresce a necessidade de armazenar grandes massas de dados e organizá-los de uma forma que favoreça sua recuperacão. A proposta deste projeto é oferecer uma extensão ao SGBD Postgresql que permita a fragmentacão dos dados para que os mesmos sejam distribuídos da forma mais conveniente nos servidores de banco de dados que compõem o cluster. Para isso será necessário adicionar os catálogos que definem o esquema da fragmentação e modificar a ferramenta "pgcluster" para gerenciar a localização dos dados e otimizar as consultas. Além disso será proposta uma extensão à liguagem DDL para a definição dos parâmetros da distribuição dos dados e dos sítios que formam o cluster do sistema de banco de dados distribuído. Todas as ferramentas e metodologias utilizadas no projeto e em sua respectiva execução fazem parte do ambiente de trabalho dos desenvolvedores do Postgresql e serão descritas de acordo com sua relevânci
    corecore